推理

仅需10%思维链标注,等同全量性能!计算所发布推理监督新范式

大语言模型(LLMs)推理能力近年来快速提升,但传统方法依赖大量昂贵的人工标注思维链。中国科学院计算所团队提出新框架PARO,通过让模型学习固定推理模式自动生成思维链,只需大模型标注1/10数据就能达到全量人工标注的性能。这种方法特别适合像金融、审计这样规则清

推理 范式 token 计算所 全量 2025-10-28 14:30  3

高通推出AI 200/250加速卡:最高768GB内存,主打模型推理

如今AI行业可谓蓬勃发展,厂商们也愿意花费大价钱去购买AI训练以及推理设备,可以说现在的AI设备已经处于严重供不应求的状态,完全就是摇钱树和印钞机,因此越来越多的厂商投入到AI训练以及推理芯片的研发中,目前著名的移动处理器制造商高通就宣布了两款为AI特别打造的

推理 高通 内存 加速卡 768gb 2025-10-28 13:44  3

NeurIPS25高分论文|以判别式监督学习强化推理LLM,解决难度偏差和熵崩塌难题

作者介绍:德州农工大学博士生李港,专注于设计和应用高效算法到大规模机器学习和人工智能任务,包括增强大型基础模型的后训练算法、对抗性鲁棒学习算法和分布鲁棒性学习算法。曾发表数篇论文在 NeurIPS、ICML、KDD 等顶会, 并作为主要贡献者之一发布了针对不平

论文 推理 llm neurips25 neurips25高 2025-10-28 11:14  5

仅需10%思维链标注,等同全量性能!中科院发布推理监督新范式

大语言模型(LLMs)推理能力近年来快速提升,但传统方法依赖大量昂贵的人工标注思维链。中科院计算所团队提出新框架PARO,通过让模型学习固定推理模式自动生成思维链,只需大模型标注1/10数据就能达到全量人工标注的性能。这种方法特别适合像金融、审计这样规则清晰的

推理 范式 中科院 token 全量 2025-10-28 12:18  3

《开推 4》疯了!“赫丽摸金宇” 原班六人回归,这波 “朋综 + 推理” 能封神吗?

推理综艺圈炸出王炸消息!《开始推理吧》第四季官宣拟邀 “赫丽摸金宇” 原班六人回归,白宇、迪丽热巴、金靖、刘宇宁、张凌赫、周柯宇即将重聚推市,# 开推原班人马回归# 话题瞬间刷屏热搜,老粉直呼 “等的就是这六人组,我的电子榨菜终于续上了”。新副本开启的消息更是

推理 张凌 赫丽 金宇 原班 2025-10-28 10:58  3

Meta团队揭秘大模型&

这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

模型 meta 模态 推理 先验 2025-10-28 06:18  3